1 Gráfico de dispersión 3D (lstat, rm, medv)

Este gráfico muestra cómo se relacionan simultáneamente las siguinetes variables:

  • lstat: Porcentaje de población con bajo estatus socioeconómico.
  • rm: Número promedio de habitaciones por vivienda.
  • medv: Valor medio de la vivienda.

Análisis:

  • Se observa una relación inversa entre lstat y medv: a mayor porcentaje de población con bajo estatus, menor es el valor medio de las viviendas.
  • De manera complementaria, un mayor número de habitaciones promedio (rm) tiende a asociarse con un valor más alto de las viviendas.

2 Histograma y Curva de Densidad para lstat

Esta visualización muestra la distribución de la variable lstat mediante un histograma sobre el cual se ha superpuesto una curva de densidad suavizada.

Análisis:

  • La distribución de lstat es asimétrica positiva, con una mayor concentración de barrios en los que el porcentaje de población con bajo estatus es bajo.
  • Esto sugiere que la mayoría de los barrios en el conjunto de datos tienen poblaciones mayoritariamente con estatus socioeconómico medio o alto.

3 Diagrama de dispersión 2D entre lstat y medv

Este diagrama de dispersión muestra la relación entre lstat y medv, con los puntos coloreados según el valor de la variable chas (que indica si el barrio colinda con el río Charles).

Análisis:

  • La relación entre lstat y medv es claramente negativa: los valores de las viviendas disminuyen conforme aumenta el porcentaje de población con bajo estatus.
  • La línea de suavizado (LOESS) refuerza esta tendencia no lineal, capturando bien la curvatura de la relación.
  • El color por chas permite identificar si el hecho de estar cerca del río tiene algún impacto adicional. Aunque los barrios que colindan con el río (chas = 1) son menos frecuentes, no presentan una desviación significativa en la relación general observada.